E³RL: Aprendizaje por Refuerzo Borrable para Superar la Maldición Autoregresiva E³RL: nuevo método de RL que elimina la maldición autoregresiva en LLMs. Permite razonamiento lógico autocurativo con memoria lineal. Supera SOTA en benchmarks 2026-06-17 · 2 min